GPT-5≈o3.1!OpenAI首次详解思考机制:RL+预训练才是AGI正道 该观点出自OpenAI研究副总裁Jerry Tworek的首次播客采访,而Jerry其人,正是o1模型的主导者之一。 正道 openai agi rl agi正道 2025-10-20 15:09 3